#7.2 -  O modelo mais simples possível
library(MASS)
data(Animals)
anim.m2 <- lm(log(brain)~log(body),data=Animals,subset=!(log(Animals$body)>8&log(Animals$brain)<6))
anim.m0 <- lm(log(brain)~1, data=Animals,subset=!(log(Animals$body)>8&log(Animals$brain)<6))
anova(anim.m0,anim.m2)
anova(anim.m2)

#7.2.a - Qual a relação do comando 'anova' acima com anova(anim.m2)

#Eles fazem a comparação entre as variâncias de dois modelos.


#7.2.b - Qual a relação entre os valores obtidos por estes comandos: summary(anim.m0)
mean(log(Animals$brain[!(log(Animals$body)>8&log(Animals$brain)<6)]))
sd(log(Animals$brain[!(log(Animals$body)>8&log(Animals$brain)<6)]))

# A média é igual ao valor estimado do intercepto no modelo anim.m0 e o desvio padrão é o valor do erro padrão do modelo anim.m0.


# 7.b - Exercícios de Regressão Múltipla: Galileu estava Certo?

setwd ("/Users/irisamatimartins/Documents/Aula R/Aula 7")
dados <- read.table("arquivo1.csv", header=T, sep=";", as.is=F)
dados
dados$age[dados$age==99] <- NA
dados$height[dados$height==99] <- NA
dados$smoke[dados$smoke==9] <- NA
dados$smoke <- as.logical(dados$smoke)
dados <- dados[apply(is.na(dados),1,sum)==0,]
summary(dados)

mod.1 <- lm(bwt~gestation + smoke + parity + age + weight + height + gestation:smoke, data=dados)
summary(mod.1)
anova(mod.1)

mod.2 <- lm(bwt~gestation + smoke + parity + weight + height + gestation:smoke, data=dados)
summary(mod.2)
anova(mod.2)

mod.3 <- lm(bwt~gestation + smoke + parity + height + gestation:smoke, data=dados)
summary(mod.3)
anova(mod.3)

mod.4 <- lm(bwt~gestation + smoke + height + gestation:smoke, data=dados)
summary(mod.4)
anova(mod.4)

mod.5 <- lm(bwt~gestation + smoke + height,  data=dados)
summary(mod.5)
anova(mod.5)

# A maior significância foi obtida pelo modelo mod.5.
